今までは一つの母平均に対する信頼空間を検討してきましたが,次は2つの母集団の平均の差の信頼空間を調べてみましょう.
たとえば,
一学期と二学期との理科のテストの平均値の差
〇〇県と△△県のコーヒー使用量の差
などなど.
ここでも母集団の性質,事前にわかっていることで場合分けできます.それは,
対応のあるデータの場合:サンプル数が同じ場合
(一学期と二学期との理科のテストの平均値の差,生徒の数が変わらない場合)
対応のないデータの場合:サンプル数が異なる場合
(1組と2組の成績の差など)
です.さらに,
母分散が既知で等しい場合 : 正規分布
母分散が既知で異なる場合: 正規分布
母分散が未知で等しい場合: t分布
母分散が未知で等しいかどうかわからない場合: t分布でWelch検定
と分けることができます.ややこしいです.
・対応のあるデータの場合:サンプル数が同じ場合
さて,2つの母集団,
\(\Large \displaystyle N( \mu_X, \sigma_X^2), N(\mu_Y, \sigma_Y^2)\ \)
差の分布は,ここ,にあるように,
\(\Large \displaystyle N( \mu_X - \mu_Y, \sigma_X^2 + \sigma_Y^2) \)
となります.これは誤差伝搬法則からも同様の結果となります.したがって,
\(\Large \displaystyle \mu_d \equiv \mu_X - \mu_Y \)
では信頼空間に用いる不偏分散はどのように推定するかというと,
それぞれの差分の値
を用いればいいことになります.2つの母集団の数,対応が一致しているのでわかりやすいですね.
したがって,
n個のそれぞれの集団,x1i,x2iを考えると,差分の平均を x d,差分の不偏分散をsd2とすると,
\(\Large \displaystyle \bar{x}_d = \frac{1}{n}\sum_{i=1}^n (x_{1i} - x_{2i} ) \)
\(\Large \displaystyle s_d^2 = \frac{ \displaystyle \sum_{i=1}^n \left(x_i - y_i -\bar{x}_d \right)^2 }{n-1} \)
となります,式はちょっとややこしくなりましたが,要は,
それぞれの差分を取る
その差分の不偏分散を求める
だけです.
あとは,一つの母集団の信頼空間と同様に,
母分散がわかっている場合は,
\(\Large \displaystyle - 1.96 \hspace{52 pt}\leq \hspace{12 pt} \frac{\mu_d - \bar{x}_d}{ \sqrt{\frac{\color{red}{\sigma}^2}{n}}} \hspace{12 pt} \leq \hspace{12 pt} 1.96 \)
母分散がわからない場合には,
\(\Large \displaystyle - t_{\alpha/2} (n-1) \hspace{12 pt}\leq \hspace{12 pt} \frac{\mu_d - \bar{x}_d}{ \sqrt{\frac{\color{red}{s_d}^2}{n}}} \hspace{12 pt} \leq \hspace{12 pt} t_{\alpha/2} (n-1) \)
となるのです.
これは比較的簡単で,差分といえども,その差分をあたかも一つの母集団として考えれば良いことになります